クラスメソッド データアナリティクス通信(機械学習編) – 2024年3月号
データアナリティクス事業本部 インテグレーション部 機械学習チームの鈴木です。
クラスメソッド データアナリティクス通信(機械学習編) の2024年3月号です。2024年2月分のアップデート情報をお届けできればと思います。
はじめに
AWSでは、S3 Express One Zoneを使ったAmazon SageMakerのモデルトレーニング高速化の一般提供開始がアナウンスされました。またAmazon Rekognitionで新しいモデレーションラベルが追加され、より精度高く利用できるようになったことも嬉しいお知らせでした。
Google Cloudでは、なんといってもVertex AI Geminiの一般提供開始が目玉だったと思います。これに合わせてBigQuery MLからも利用ができるようになりました。また、BigQuery MLからVertex AI PaLM2 APIへエンべディングを依頼するためのML.GENERATE_EMBEDDING
関数の一般提供開始も大きなポイントでした。これによりBigQueryでSQLのみでテキストのエンべディングからベクトルの類似度検索・テキスト生成までできるようになりました。
それでは各々のアップデートを振り返って行ければと思います。
※ アップデートは機械学習チームメンバー内で業務に取り入れられそうかを中心に確認しているので、一部取り上げられていないものもあるかもしれませんが、参考になりましたら幸いです。また、複数のパブリッククラウドのサービスを取り上げますが、比べたりする意図はありません。
AWS
Amazon SageMakerのアップデート
S3 Express One Zoneを使ったモデルトレーニング高速化
Amazon S3 Express One Zoneストレージクラスを使って、トレーニングデータ・チェックポイント・モデルの入出力時間を短縮し、Amazon SageMakerモデルトレーニングを高速化できるようになったそうです。
APIのアップデート
SageMaker HyperPodに関するAPIの追加がありました。
Amazon EC2のアップデート
Capacity Blocks for MLでサポートするインスタンスおよびリージョンの拡張
以下のインスタンス・リージョンが追加で利用できるようになりました。
- P5インスタンス:米国東部 (バージニア北部) リージョン
- P4dインスタンス:米国東部 (オハイオ) ・米国西部 (オレゴン) リージョン
Amazon Rekognitionのアップデート
新しいモデレーションラベルを追加
モデルに26の新しいモデレーションラベルが追加され、モデレーションラベルの分類も2層から3層に拡張されたことで画像に対するコンテンツモデレーションの精度が向上しました。
アニメーションやイラスト付きのコンテンツを識別する新しい機能も導入されたそうです。
Amazon Bedrockのアップデート
マネジメントコンソールのUIが新しく
マネジメントコンソールのデザインが刷新され、よりモダンで使いやすくなりました。
Amazon Pollyのアップデート
トルコ語の女性音声NTTSであるBurcuが追加
トルコ語向けに初めてのNTTSが追加されました。
APIのアップデート
Burcu追加によるAPIのアップデートがありました。
Google Cloud
Vertex AIのアップデート
Vector Searchがのコンソールがより使いやすく
コンソールから、インデックスおよびエンドポイントの作成・エンドポイントへのインデックスの配置・最近傍のインデックスの照会ができるようになったようです。
Model Gardenへのモデル追加
以下の8つが追加になりました。
- Stable Diffusion XL LCM
- LLaVA 1.5
- PyTorch-ZipNeRF
- LLaMA 2 (Quantized)
- WizardLM
- WizardCoder
- AutoGluon
- Lama (Large mask inpainting)
また、ワンクリックのチューニングボタンや20以上のモデルに対する事前訓練済みのOSSアーティファクトデプロイボタンの追加や、各種モデル向けのノートブックの追加もありました。
ビデオ向けのマルチモーダルエンべディングが一般提供開始
multimodalembedding
モデルによるビデオ向けのマルチモーダルエンべディングが一般提供開始しました。
Vertex AI Geminiが一般提供開始
Vertex AI Gemini 1.0 ProおよびGemini 1.0 Pro Visionマルチモーダルモデルが一般提供開始しました。
europe-west1
・europe-west2
・europe-west3
・europe-west4
・europe-west9
のリージョンでも利用できるようになりました。
Gemmaモデルが一般提供開始
Geminiモデルに基づく軽量の生成人工知能(AI)オープンモデルのセットであるGemmaモデルも一般提供開始しました。
BigQueryのアップデート
リモートモデルでGeminiが利用可能に
Vertex AI Gemini向けの連携機能が一般提供開始しました。
ML.GENERATE_TEXT関数でgemini-pro
が指定できるようになりました。
また、BigQuery DataFramesでもbigframes.ml.llm
モジュールのGeminiTextGeneratorクラスを使うことでVertex AI Geminiに問い合わせをすることができるようです。
ML.GENERATE_EMBEDDING関数が一般提供開始
Vertex AI textembedding-gecko*テキストエンべディングモデルにリクエストを実行するためのML.GENERATE_EMBEDDING
関数が一般提供開始しました。
これでBigQuery MLの組み込みの機能のみでテキストエンべディングができるようになりました。
ちょうど先日関連するイベント登壇をしたのでとても嬉しいです。
時系列分析用の関数がプレビューで追加
時系列分析用のtime-series関数とrange関数がプレビューで提供を開始しました。
Text-to-Speechのアップデート
スタジオボイスのGAとカジュアルボイスのプレビュー提供開始
スタジオボイスが一般提供開始しました。 カジュアルボイスがプレビュー版で提供開始しました。
カジュアルボイスではより流暢で自然な雰囲気の音声が出力されるようです。
イベント・サービス情報
相談会
クラスメソッドのアナリティクス分野の支援では、AWS、Google Cloudを中心としたクラウド上でのデータ分析基盤環境づくりにおいてトータルでサポートしています。
このようなことでお困りではないですか?
企業内に点在するデータを1箇所にまとめて分析したい クラウド上で分析基盤を導入したい・・・ データを活用したいが、具体的に何から始めたらいいかわからない 機械学習相談会のお申込みはこちらです。お気軽にご相談ください。
データ分析相談会のお申込みはこちらです。
機械学習システム導入支援サービスについて
AWSやGoogle Cloudなどパブリッククラウドにて、機械学習サービスを活用したシステムの導入支援を行います。詳しくは以下のページをご覧ください。
例えば以下のようなケースをご支援しています。
- ECサイトのレコメンドシステムを構築し、利用者にパーソナライズされたおすすめ商品を提示する
- SNSや問い合わせのログなどから、テキストマイニングを活用したインサイトの発見する
- 画像解析により、工場における不良品検出や農業・畜産業分野での生育管理を効率化する
- 売上や消費者の行動などから、将来の需要を予測する
最後に
2024年2月に発表された、AWSとGoogle CloudのML機能のアップデートについて、メンバーでピックアップした情報についてご紹介しました。
データアナリティクス通信(機械学習編) - 2024年3月号は以上です。